Analiza ofert wynajmu nieruchomości z portalu gumtree.pl
9 grudnia 2016
Inspiracja
- Praktyczny wymiar projektu
- Aplikacja bazująca na modelu przewidującym ceny

Struktura danych

Jedna zmienna objaśniająca
Przed - 13 tysięcy ofert, po - 10 tysięcy

Wiele zmiennych objaśniających
Przed - 39 zmiennych niezależnych, po - 26
| Best Subset Regression |
2p |
1012 |
490 |
| Forward Stepwise Selection |
p2⁄2 |
760 |
490 |
| Backward Stepwise Selection |
p2⁄2 |
760 |
490 |
| Walidacja |
p2⁄2 |
760 |
506 |
| Kroswalidacja |
K p2⁄2 |
7605 |
493 |
| Ridge Regression |
K nλ |
1000 |
493 |
| Lasso |
K nλ |
1000 |
492 |
Napotkane problemy
- Wyrafinowana analiza treści opisu
- Propozycja dokładnego opisu atrybutów w formularzu na gumtree.pl

Przygotowanie do projektu
Ukończenie kursów:
- Machine Learning at Coursera by Andrew Ng (18 godzin)
- Statistical Learning at Stanford ONLINE by Trevor Hastie and Robert Tibshirani (15 godzin)
Zapoznanie się z narzędziami:
Kod i inne projekty
- Kod napisany na potrzeby tego projektu na github
- Raport z innego projektu w którym brałem udział